Corpus: ces_newscrawl_2019_10K

Other corpora

5.1.18 Words nearly always as next neighbors

Strong NN co-occurrences with a low probability of being separated

The quotient below is calculated as freq(word1)*freq(word1)/NN_freq^2.

Word 1 Word 1 Frequency of word 1 Frequency of word 2 Frequency as NN Qoutient
TOP 09 12 10 10 1.20
Mladá Boleslav 6 5 5 1.20
ČESKÁ POZICE 5 5 5 1.00
levém křídle 4 5 4 1.25
play off 7 5 5 1.40
odpadních vod 5 5 5 1.00
MF DNES 4 4 4 1.00
cestovního ruchu 3 4 3 1.33
záchranná služba 3 4 3 1.33
sledované vlaky 3 4 3 1.33
nadmořské výšce 3 4 3 1.33
Thomas Greiss 3 3 3 1.00
Premier League 3 3 3 1.00
Trhové Sviny 3 3 3 1.00
Financial Times 3 3 3 1.00
kostní dřeně 3 3 3 1.00
pozn. red. 3 3 3 1.00
zdravého rozumu 4 3 3 1.33
Ostře sledované 3 3 3 1.00
Poslanecká sněmovna 3 3 3 1.00
41 msec needed at 2025-04-06 02:04